首页> 外文OA文献 >Reinforcement Learning Produces Dominant Strategies for the Iterated Prisoner's Dilemma
【2h】

Reinforcement Learning Produces Dominant Strategies for the Iterated Prisoner's Dilemma

机译:强化学习为迭代课程提供了主导策略   囚徒的困境

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We present tournament results and several powerful strategies for theIterated Prisoner's Dilemma created using reinforcement learning techniques(evolutionary and particle swarm algorithms). These strategies are trained toperform well against a corpus of over 170 distinct opponents, including manywell-known and classic strategies. All the trained strategies win standardtournaments against the total collection of other opponents. The trainedstrategies and one particular human made designed strategy are the topperformers in noisy tournaments also.
机译:我们介绍了使用强化学习技术(进化算法和粒子群算法)创建的迭代囚徒困境的比赛结果和几种强大的策略。这些策略经过训练,可以很好地抵抗170多个不同对手的攻击,包括许多众所周知的经典策略。所有训练有素的策略都赢得了其他对手的总标准比赛。训练有素的策略和一种特殊的人为设计策略也是在嘈杂的比赛中表现最佳的人。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号